Day15 單純貝氏分類器實作

2021 iThome 鐵人賽

DAY 15

AI & Data

我比機器更需要學習系列第 15 篇

13th鐵人賽

Tun

2021-09-21 03:10:51

1393 瀏覽

分享至

https://github.com/PacktPublishing/Machine-Learning-Algorithms

單純貝氏有三種版本白努力、多項式、高斯，今天先學白努力。
白努力:是二元分布，適用於特徵存在或不存在時。
多項式:是離散分布，適用於特徵為整數時(NLP中單辭出現頻率)。
高斯:是連續分布。

白努力單純貝氏

一樣先導入套件，上面的是用來算數學的;下面的是用來畫畫的，並且幫它們取綽號(np & plt)。

import numpy as np
import matplotlib.pyplot as plt

再來，用seed()隨機產生整數的亂數後，設定樣本數300，建立資料集。

np.random.seed(1000)
nb_samples = 300
from sklearn.datasets import make_classification
def show_dataset(X, Y):
    fig, ax = plt.subplots(1, 1, figsize=(30, 25))
    ax.grid()
    ax.set_xlabel('X')
    ax.set_ylabel('Y')
    for i in range(nb_samples):
        if Y[i] == 0:
            ax.scatter(X[i, 0], X[i, 1], marker='o', color='r')
        else:
            ax.scatter(X[i, 0], X[i, 1], marker='^', color='b')
    plt.show()
X, Y = make_classification(n_samples=nb_samples, n_features=2, n_informative=2, n_redundant=0)

接著，把資料分成訓練用跟測試用，跟之前一樣。不同的是BernoulliNB裡面有binarize功能，用來內部轉換特徵，需要自行設定二元門檻，這裡是設定0.0，建模後得到準確率。

from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.naive_bayes import BernoulliNB
bnb = BernoulliNB(binarize=0.0)
bnb.fit(X_train, Y_train)
print('Bernoulli Naive Bayes score: %.3f' % bnb.score(X_test, Y_test)) // Bernoulli Naive Bayes score: 0.840
bnb_scores = cross_val_score(bnb, X, Y, scoring='accuracy', cv=10)
print('Bernoulli Naive Bayes CV average score: %.3f' % bnb_scores.mean()) // Bernoulli Naive Bayes CV average score: 0.853

最後，試試看模型準不準確就完工了。

data = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
Yp = bnb.predict(data)
print(Yp)

最近，小弟有看到一篇資料科學家寫的很淺顯易懂的貝氏定理，在此跟各位分享

https://leemeng.tw/intuitive-understandind-of-bayes-rules-and-learn-from-experience.html

Day14 邏輯斯迴歸實作

Day16 支持向量機實作

系列文

我比機器更需要學習共 23 篇

RSS系列文訂閱系列文

6 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

我比機器更需要學習系列 第 15 篇

Day15 單純貝氏分類器實作

白努力單純貝氏

尚未有邦友留言

標記使用者

我比機器更需要學習系列第 15 篇